1996. 5. 1 / 『월간조선』


조선왕조실록 CD-ROM化의 거대한 충격

다 읽는데 10년이 걸리는 자료를 간편하게 검색 추적 활용할 수 있게 됐다


세계에서 유례가 없는 방대하고 정확한 종합 역사 기록을 이제야 제대로 이용하게 되었다. 그 파급 효과는 천문·지리·기상·풍속·경제 등 광범위한 분야에 미쳐 우리의 조국을 바라보는 시야를 넓히고 멀리 있어 보이던 朝鮮을 우리의 바로 곁으로 당겨 놓을 것이다. -편집자-


김   현

서울시스템(주) 상무이사


  CD-ROM, <조선왕조실록> 위한 매체


  “CD-ROM이라고 하는 매체는 바로 <조선왕조실록>을 위해서 태어난 것 같군요. CD-ROM이 아니었으면  그 내용을 이렇듯 속속들이 들여다볼 방법이 없었을 테니 말입니다.”

  작년 10월 <CD-ROM 국역 조선왕조실록>을 출간한 이후, 이 새로운 모양의 <실록>을 접한 여러분이 다양한 소감을 피력하였지만, 글을 쓰시는 K 선생의 이 말은 특히 기억에 남는다.

  “우리 선조들이 수백년 동안 그 거질(巨帙)의 기록을 만들어 온 것은 그들도 후세에 이같은 매체가 나올 걸 예상해서 그랬던 것이 아닐까요?”

  K 선생의 말은 단순히 농담으로만 들어넘길 수 없는 무엇인가를 담고 있었다. 사관(史官)이라고 부르는 <조선왕조실록>의 저자들, 그들이 오백년이 넘는 긴 세월 동안 이 거대한 기록을 남겨 온 이유,  조선의 조정이 갖은 환란 가운데에도 단 네 질의 책을 인쇄하기 위해 모든 지면을 금속 활자로 조판한 이유는 무엇일까? 복잡한 논의 없이도 우리에게 분명하게 인식되어질 수 있는 한 가지 사실은 그들이 ‘후손에게 알리기 위해’ 그 기록을 남겼다고 하는 것이다.

  태조 연간, 조선의 사관들이 <실록>을 남기기 위해 최초의 사초(史草)를 만들기 시작했을 때, 그들은 그 왕조가 얼마나 오랫동안 이어질지 알지 못했을 것이다. 그들은 그 명(命)의 길고 짧음에 괘념치 않고 그들의 시대에 일어난 모든 일들을 기록으로 남겨 역사의 거울이 되게 하고자 했다. 그런데 그 천명(天命)이 오백년이 넘게 유지된 결과 우리 후손들은 세계에서도 유래가 없는 거질(巨帙)의 역사서를 물려받게 된 것이다.  선조들이 의도한 것은 분명 그 기록을 단순히 유물로서 전하는 것이 아니었을 것이다.  그 기록을 읽음으로써 우리의 역사를 이해하고 평가할 것을 숙제로 남긴 것이 분명하다.

  그러나 그 숙제의 규모가 이렇듯 커지고 보니 우리 후손들은 이 위대한 자산이 남겨졌음에도 불구하고 선뜻 그 속을 들여다 볼 엄두를 내지 못하는 처지가 돼 버렸다.  <실록>을 만들어 온 우리의 선조들 중 어느 한 분이라도 후손들의 이같은 고민을 염두에 둔 분이 계셨을까? <조선왕조실록> 한문(漢文) 원문에 쓰인 글자 수는 모두 5천만 자. 한 면에 7백 자 ~ 9백 자씩의 한자(漢字)가 빽빽하게 쓰여진 지면이 7만 장에 이른다. 탁월한 한문 실력으로 하루에 20 장씩을 독파한다고 해도 다 읽는 데 10년이 걸릴 분량이다.  후손들에게 읽히기 위한 기록을 남기면서 그 후손들로 하여금 읽을 엄두도 내지 못하게 만든 것은 선조들의 무책임이라고 해야 할까?  사관들이 이 점을 염려하여 <조선왕조실록>을 보다 요약된 형태로 정리하여 단 몇 권의 책만을 남겼다면 어떠했을까? 그 경우, <실록>의 곳곳에서 생동하는 그 풍성한 이야기꺼리의 대부분이 쓰여질 지면을 얻지 못한 채 소멸되고 말았을 것이다.  우리의 선조들이 ‘후손들은 이 많은 기록을 어떻게 읽을지’에 대해 고민했기를 바라는 것은 그들에 대한 정당한 요구가 아니다. 아마도 <실록>의 저자들은 그들이 그 기록을 남기는 데 최선을 다했듯이, 후손들도 그 기록을 읽고 이해하는 데 최선을 다할 것을 기대했을 것이다.

  1968년부터 1993년까지 26년 동안 정부의 지원으로 ‘세종대왕기념사업회’와 ‘민족문화추진회’ 양 기관에서 추진한 <조선왕조실록> 국역 사업은 우리의 역사가 오늘날의 현실 속에서 생명을 가지고 숨쉴 수 있게 하기 위한 노력이었다. 이 사업을 통해  <실록>은 물건으로만 전하는 ‘유물’이 아니라 뜻을 전달하는 ‘역사 기록’의 의미를 되찾게 되었다. 그리고 조선왕조실록 CD-ROM의 간행은 그 되살아난 ‘역사 기록’에 대해 현실적인 ‘가독성(可讀性)’을 부여했다는 의미를 지닌다.  조선시대 사관들 중 그 누구도 조선왕조가 지난 후에 CD-ROM이 발명되어 <실록>의 매체 역할을 하리라고는 생각지 못했겠지만, 후손들이 나름대로 지혜로운 전수 방법을 찾을 것을 예견했기에 그와 같은 유산을 남긴 것이다. <조선왕조실록 CD-ROM>의 간행은 선조들의 그같은 여망에 대한 우리 세대의 응답이라고 해도 무방할 것이다.


  <조선왕조실록 CD-ROM>의 개발


  서울시스템주식회사의 한국학데이터베이스연구소에서 <조선왕조실록>이라고 하는 역사적인 문헌의 데이터베이스화 사업에 착수한 것은 1992년 가을의 일이었다.  3년 동안 15 명의 인문계 연구자, 25 명의 프로그래머, 80 명의 서체개발 요원, 200여 명의 교정 요원, 300여 명의 자료 입력 요원들이 동원되어 한자(漢子) 코드 제정과 서체 개발 등 기초 환경 조성 업무에서부터 시작하여 자료 입력을 위한 문서편집기 개발, 자료 입력, 교정, 기사 요지 작성, 분류 주제 정리, 검색 소프트웨어 개발 등의 업무를 단계적으로 진행하였다. 개발이 완료된 <국역 조선왕조실록> 데이터베이스는 1995년 10월에 CD-ROM 판으로 간행되어 일반에게 보급되기 시작하였다.

  이 데이터베이스에서는 <조선왕조실록>의 모든 기사를 일자별(日字別), 분류별(分類別) 색인을 통해 탐색될 수 있도록 하였으며, 본문 속의 모든 한글․한자(漢字) 단어에 대한 조건 검색 기능도 부여하였다.  <세종실록> 「오례(五禮)」 부분에 수록된 5백 종의 도식과 삽도 또한 정밀하게 가공 입력하여 멀티미디어 데이터베이스의 면모를 갖추었으며, 본문 속의 모든 동일 단어와 어구는 서로 연계하여 참조할 수 있도록 하였다. 본문 속에 쓰여진 모든 한자(漢字)가 한 자도 빠짐없이 컴퓨터 화면에 출력되고 인쇄될 수 있도록 17,367자의 트루 타입 한자 폰트를 제작하여 프로그램 속에 부가하였으며, 검색된 자료의 2차적인 활용의 편의를 증진시키기 위해서 검색 결과의 출력 및 화일 저장 그리고 다른 응용 프로그램으로의 이동 복사 기능을 구현하였다.

  이 데이터베이스에 수록된 실록 기사의 수는 총 362,161 건, 그 속에 쓰여진 문자는 모두  1억9천8백만 자에 달하는 것으로 조사되었다. 이것은 본문 이외에도 362,161 건의 기사 제목에 쓰인 1천7백만 자와 162,954개 항목의 역주에 쓰인  8백3십만 자를 포함한 값이며, 순수하게 국역 실록 본문에만 쓰인 글자는 1억7천2백만 자이다.

  본문 속의 단어는 풀 텍스트 검색을 할 수 있도록 모두 색인화 되었는데, 색인 생성을 위해 추출된 어절의 수는 4천1백만 개였다. 여기에 덧붙여 단어 검색시 검색율을 높이기 위해 본문 어휘 중 2 글자가 넘는 어절은 모두 1 자 단위로 절단하여 색인을 생성한 결과, 색인 어휘의 총 수는 7천4백만 개가 되었다.

  <국역 조선왕조실록>의 방대한 정보량을 생각하면, 그것을 입력하여 단순히 CD-ROM이라고 하는 매체에 담아 내는 일만 해도 엄청난 과업이 아닐 수 없다. 하지만 이 개발 사업의 목표는 처음부터 그러한 수준에 그치는 것이 아니었다. 컴퓨터 시스템에 대한 이해가 전혀 없는 초보자라 할지라도 기본적인 조작으로 <조선왕조실록>의 어느 구석에 숨은 정보든 한 순간에 찾아내고 또 그것을 즉시 인쇄하거나 개인용 워드프로세서로 옮겨 자유롭게 편집할 수 있는 소프트웨어의 개발이 더욱 우선적인 과제였다. CD-ROM에 담긴 <조선왕조실록>이 세계에서 유례가 없는 질과 양의 정보인 만큼,  그 정보를 효과적으로 찾아내고 정리하는 기능도 정보의 수준에 걸맞는 우수한 것으로 만들고자 한 것이다.


  <조선왕조실록 CD-ROM>의 효용성


  <조선왕조실록>의 모든 기사를 정보화한 한 이 CD-ROM의 효용성은 여러 각도에서 설명될 수 있을 것이다.  그 첫번째는 조선시대사 연구자들의 연구 능률을 획기적으로 향상시켜 줄 것이라는 점이다. 예컨대, 조선시대의 양민들이 억울함을 호소하는 수단으로 쓰였던 ‘신문고(申聞鼓)’에 대한 기사는 태종 1년(1491년)부터 순조 27년(1827년)까지 427년간 모두 172개가 나오는데, 이것은 CD-ROM을 이용하면 1초 이내에 얻을 수 있는 결과이지만, 누군가 그 기록들을 일일이 책을 읽으면서 찾으려 했다면 하루에 1백 페이지씩 읽어도 4년이 넘어 걸렸을 일이다. 이제 적어도 <실록>을 사료로 하는 역사 연구에서만큼은 연구자들이 ‘사료 찾기’의 부담에서 벗어나 역사의 참된 의미를 캐는 창의적인 연구에 몰입할 수 있는 계기가 마련되었다고 할 수 있다.

  사료를 다루는 데 있어서 역사 연구자보다 더 큰 어려움을 겪어 왔던 과학, 경제, 법제 등 다른 학문 분야 종사자들에게도 우리 사료를 손쉽게 접근할 수 있는 길을 열어 학제간(學際間) 연구의 가능성을 높이게 된 것도 중요한 일이다. 태조 2년부터 헌종 12년까지 454년간 1,951 건의 지진(地震)이 발생한 기록을 순식간에 찾아내어 지질 연구의 자료로 사용한다든가, 태종 1년부터 헌종 9년까지 443년간 317건의 저화(楮貨: 종이돈) 사용에 대한 기록을 한꺼번에 끄집어내 경제사 연구의 자료로 활용하는 것 등은 예전에는 쉽게 기대할 수 있는 일이 아니었지만, 이제는 너무도 용이한 일이 되어 버렸다.

  <조선왕조실록 CD-ROM>은 <실록>을 전문 연구자들의 전유물에서 일반인들의 문화 자산으로 ‘대중화’하는 길을 열어갈 것이라는 점에서도 그 출간의 의의를 지적할 수 있을 것이다.  <실록>의 가운데에는 “사대부들이 어쩌면 이런 것도 적어 놓았을까?”할 정도로 자질구레한 일, 낯뜨거운 일, 그렇지만 그것이 바로 시공을 초월한 인간적 삶의 진솔한 모습이기에 더욱 흥미로울 수밖에 없는 기사들이 곳곳에 박혀 있다. <조선왕조실록>의 구석에 구석에 산재한 이러한 기사들을 남김없이 발굴해 낼 수 있는 기능을 제공하는 <실록 CD-ROM>은  전통문화의 대중적 이해 증진과 새로운 문화 상품의 개발에 기여할 것이다. 실록에 담겨 있는 흥미로운 수많은 기록들을 소설, 영화, 연극, 무용으로 재구성하여 작품화하는 길을 열어 줄 것이기 때문이다.


 전통 문화와 정보 기술


   <조선왕조실록>을 데이터베이스화하여 이와 같이 다양한 효용을 발휘하게 한 것은 실로 명분있는 일이었다. 그러나 그 ‘명분’ 있는 일을 실제로 결행하여 완수하기까지는 형언하기 어려운 어려움들이 있었던 것이 사실이다. 자료량의 방대함도 문제였지만, 그보다는 고전이라고 하는 자료의 질적 특수성이 문제의 해결을 어렵게 하였다. 요즈음의 전산자료를 다루는 일반적인 기술만 가지고는 소기의 결과물을 만들어 낼 수가 없었기 때문이다.  3년간의 사업을 진행하는 동안 개발진들은 이 사업을 계기로 우리나라의 고전 자료와 정보 기술 사이에 서로 교통할 수 있는 통로를 만들어 놓지 않으면, 그 길을 뚫기가 날이 갈수록 어려워지리라고 하는 절박한 심정을 느끼지 않을 수 없었다.

  과학 기술에 대해 일반인들이 가지고 있는 막연한 환상 중의 하나는 그것이 발달할수록 그 혜택의 범위도 광범위하게 넓어지리라고 기대하는 것이다. 틀린 생각이라고는 할 수 없지만 그렇지 않은 예외의 경우도 결코 적지 않다. 기술의 발달과 더불어 더욱 풍요로와지는 분야가 있는가 하면, 그 혜택의 범위에서 소외되어 상대적으로 더욱 빈곤해지는 분야도 있다. 새로운 기술의 개발이나 그 기술을 적용한 응용 상품의 생산에는 일반인들로서는 상상하기도 어려운 규모의 자금이 투여된다. 그 기술이 고도의 첨단 기술일수록 개발 비용이 커질 수밖에 없다. 개발자는 당연히 개발비의 회수 가능성을 좇아 투자 대상을 결정할 것이다. 상업성이 없는 분야의 일들은 어쩔수없이 첨단 기술의 수혜 범위 밖에 놓이게 된다. 기술과 자본이 지속적으로 투여되는 분야에서는 기술 혁신이 이루어져 생산성이 높아지고 그 결과 점차 비용을 줄이면서도 큰 성과를 얻는 일이 가능해진다. 하지만 처음부터 자본과 기술이 발을 들여놓지 않았던 분야에서는 시간이 지날수록 발달된 기술의 도입이 어려워진다. 이른바 상업성이라고 하는 요인이 기술의 발달에 따른 ‘부익부, 빈익빈(富益富, 貧益貧)’의 현상을 가속화시키고 있는 것이다.

  역사 연구와 같이 고전 자료를 다루는 분야의 학문들은 성격상 방대한 문헌 자료를 조사하고 정리하는 일이 필수적임에도 불구하고 그러한 일들을 효과적으로 처리해 줄 수 있는 컴퓨터 시스템의 혜택 범위에서 오랫동안 소외되어 왔던 것이 사실이다. 아마도 세월이 흐른 뒤에는 이 분야의 자료들로 대부분 저절로 전산화가 되겠거니 생각하는 사람도 있겠지만, 그것은 명백히 틀린 생각이다. 컴퓨터 관련 기술은 하루가 다르게 발전하고 있지만, 그 발달된 기술이 적용되는 곳은 투자의 효과가 즉각적으로 드러나는, 지극히 상업적인 분야로 국한되어 가고 있다. 무엇인가 특별한 계기가 마련되어 소외된 이 분야에 기술과 자본의 비를 인위적으로 뿌리지 않는 한, 전통 문화와 정보과학 기술은 점점 더 만나기 힘든 거리로 멀어져 갈 수밖에 없는 것이다.

  필자가 개인적으로 생각하는 조선왕조실록 데이터베이스 개발의 가장 중요한 의의는 시간이 흐를수록 멀어져만 가던 첨단 정보 기술과 고전 자료를 가까스로 끌어당겨 하나로 묶어 내었다고 하는 점이다.  소프트웨어 개발 사업의 특수한 면모 중의 하나는 동종의 소프트웨어를 지속적으로 개발할 경우 초기 개발에는 막대한 비용이 소요되나 후속 개발에는 그것이 크게 절감된다고 하는 하는 점이다. 기개발된 요소 기술의 재활용이 가능하기 때문이다. 조선왕조실록 데이터베이스의 개발 사업은 고전 자료 전산화에 필수적인 여러가지 요소 기술을 부산물로 남겼다. 이는 바로 정보 기술과 고전 자료 사이의 거리가 그만큼 좁혀졌다는 얘기가 된다.  앞으로 고전 자료 데이터베이스 개발 사업이 진행되면 될수록 그 거리는 더욱 좁아질 것이다. 반면, 고전 자료 전산화 사업이 이 한 가지에 머문 채 다시 몇년의 세월이 지나갈 경우 양자의 거리는 다시 붙들어매기 어려울 정도로 멀어질 것도 분명한 사실이다.


  <조선왕조실록 CD-ROM>의 발전 방향


  <조선왕조실록 CD-ROM>을 개발하는 동안 필자를 비롯한 개발진들은 전혀 이질적인 것으로 간주되어 온 고전 자료와 정보 기술을 접목시키는 데 필요한 여러가지 과제들을 그 어느것도 소홀히 하지 않고 최선을 다해 해결하려 했던 것만큼은 자부할 수 있을 듯하다. 하지만 그렇다고 해서 지금 만들어진 <국역 조선왕조실록 CD-ROM> 제1판이 국학 자료 전산화의 이상적인 모습을 구현한 것이라고 자신할 수 있는 것은 아니다. 그 속에는 아직도 많은 미비점이 있는 것이 사실이다.  우리는 1년 단위로 <국역 조선왕조실록 CD-ROM>의 새로운 버전을 개발할 계획을 가지고 있다. 시스템의 기능 개선 뿐 아니라, 1억7천만 자나 되는 본문의 구석 구석에 아직도 숨어 있을 여러가지 종류의 데이터 오류를 수정하는 작업을 진행할 것이다.  <국역 조선왕조실록 CD-ROM>의 간행이 공론화 되었을 때, 많은 분들이 원천 자료의 오류 부분에 대한 염려를 토로하였다. 자료가 완벽하지 못한데 어떻게 만인에게 공개되는 CD-ROM으로 간행할 수 있겠느냐는 것이었다. 그렇게 말씀하시는 분들의 학자적 양식에는 고개가 수그려지지만 그것은 분명 순서가 뒤바뀐 이야기이다. 자료는 만인에게 공개되기 이전에 결코 완벽해질 수 없다. 413권이나 되는 책을 몇 사람의 교열자가 일일이 읽어 가면서 고치는 방식으로는 우리 세대가 다 지날 때까지도 완벽한 수정본이 나오리라고 장담할 수가 없다. 반면, 수천만개의 어휘들 중 어떠한 것도 순간적으로 찾아내는 실록 데이터베이스 시스템은 자료상의 오류를 고치는 일에 있어 종이 매체와는 비교할 수 없는 능률을 안겨 줄 것이다.

  <조선왕조실록> 데이터베이스는 여건이 조성되는대로 인터넷과 같은 온라인 네트워크 상에서 연구자 누구나가 조회할 수 있고, 자신의 연구 내용을 연구 자료 화일에 첨가할 수도 있는 쌍방향 정보 데이터베이스로 발전시켜 갈 예정이다. <조선왕조실록> 데이터베이스의 활용으로 사료에 대한 종합적인 검증이 가능해짐으로써 현재까지의 학설과는 다른 새로운 역사 해석이 창출될 가능성도 있다. 그때부터는 그 다양하고 새로운 의견들이 이 데이터베이스의 각 레코드와 논리적으로 연결된 연구 자료 파일에 첨가되는 작업이 이루어져야 한다. <조선왕조실록>의 텍스트와 함께 그에 대한 여러가지 이용 성과들을 하이퍼 텍스트 구조로 역은 데이터베이스 상에서는 실록 본문에서 출발하여 그에 관련된 다른 자료로의 접근이 가능하며, 또 역으로 논문 소설 등 다른 자료에서 출발하여 거기에 인용되거나 반론이 제기된 실록 본문으로의 접근이 이루어질 수 있게 된다. 이러한 하이퍼 텍스트 데이터베이스는 더욱 풍성한 자료 제공의 역할을 할 것은 물론 우리 사회의 각계 각층의 사람들이 참여하여 우리의 역사를 논하는 활기찬 담론의 장이 될 수 있을 것이다.

  아무리 소중한 문화유산이라 할지라도 그것이 단지 역사의 유물로 남아 있을 때의 의미와 현대 사회의 각 분야에서 생명력 있게 쓰여질 때의 의미는 전연 다를 것이다. <조선왕조실록>이 그 엄청난 노력으로 현대어화 되었음에도 불구하고 그것을 활용하는 길이 소수의 전문 연구자들에게만 열려 있는 한, 대다수의 사람들에게 있어서 <조선왕조실록>은 한낮 역사가 남긴 유물에 불과한 것이다. <조선왕조실록 CD-ROM>의 간행은 그것이 고리타분한 유물에 머물지 않게 하고 현대 사회의 학술, 교육, 문화 등 여러 분야에서 그 소중한 가치가 발휘될 수 있게 하자는 취지에서 이루어진 일이다. 그러나 <조선왕조실록 CD-ROM>이 과연 그러한 취지에 부합하는 결실을 이룰 것인지의 여부는 이 데이터베이스의 이용자들의 손에 달린 일이다. 우리 문화에 대해 깊은 애정을 갖고 계신 분들의 적극적인 활용으로 이 CD-ROM이 더욱 충실한 내용의 한국학 데이터베이스로 커 나아갈 수 있기를 기대한다.